Essa análise é baseada em dados gerados por viagens de avião entre os anos de 2000 e 2024, abrangendo todos os aeroportos do mundo. Esses dados são cruciais para analisar tendências no transporte aéreo e os impactos de eventos globais no sistema aeroviário.
O setor aeroviário tem crescido ao longo dos anos, sendo esse um fator essencial para as empresas de aviação ao gerar relatórios e insights. Esses dados ajudam tanto na previsão do crescimento do número de viagens com o passar dos anos quanto na identificação de alterações causadas por eventos em diferentes países.
A base de dados da ANAC (Agência Nacional de Aviação Civil) fornece informações detalhadas sobre:
Essas informações podem ser usadas para calcular indicadores importantes para o setor de aviação, como demanda, oferta, participação de mercado e taxa de ocupação de aeronaves.
Esses dados são vitais para o setor de aviação e permitem a identificação de tendências, impactos de eventos globais e a otimização da oferta de serviços aéreos. Para empresas de aviação, ter acesso a essas métricas é crucial para melhorar o planejamento estratégico, prever o crescimento e se preparar para possíveis impactos futuros.
library(plotly)
library(dplyr)
library(tidyr)
library(DT)
Os dados estão distribuidos da seguinte forma:
data <- read.csv("C:/Users/Lucas Henrique/Desktop/UFRPE/Comp. Analise de Dados/Dados_Estatisticos.csv",sep = ";", header=TRUE)
dim(data)
## [1] 1018628 38
Temos 1.018.628 Linhas e 38 Colunas na nossa base.
Nós iremos realizar algumas alterações para que possamos utilizar a base para nossas análises. Inicialmente manteremos somente as seguintes colunas:
Após selecionar as colunas que serão utilizadas, vamos checá-las e retirar os valores que são vazios ou NA, para evitar inconsistências.
data_filt <- data_filt %>% filter(
!is.na(ANO) & ANO != "" &
!is.na(MES) & MES != "" &
!is.na(AEROPORTO_DE_ORIGEM_NOME) & AEROPORTO_DE_ORIGEM_NOME != "" &
!is.na(AEROPORTO_DE_DESTINO_NOME) & AEROPORTO_DE_DESTINO_NOME != "" &
!is.na(PASSAGEIROS_PAGOS) &
!is.na(PASSAGEIROS_GRATIS) &
AEROPORTO_DE_DESTINO_PAIS == "BRASIL"
)
PASSAGEIROS_TOTAISPor último, vamos realizar a unificação das colunas “Passageiros Gratis” e “Passageiros Pagos”, gerando a coluna resultante PASSAGEIROS_TOTAIS, referente ao total de passageiros por voo, que será um dado importante na nossa análise.
data_filt$PASSAGEIROS_TOTAIS = data_filt$PASSAGEIROS_GRATIS + data_filt$PASSAGEIROS_PAGOS
Assim, temos a disposição final do nosso dataset após as operações iniciais de pré-processamento.
datatable(head(data_filt,20), options = list(scrollX = TRUE))
12 de jun. de 2014 – 13 de jul. de 2014
5 de agosto de 2016 – 21 de agosto de 2016